简介:本课介绍数据预处理过程体系,包括数据类型与采集、文本转化与抽取、数据集成与规约、中文分词、数据清洗、特征提取与变换、特征向量化、特征降维、特征选择、可视化、词典模型、TF-IDF向量模型、主题模型等。
第1章 手工实现文本特征向量化
第2章 Gensim实现文本特征向量化
- 视频: 2-1 Gensim介绍 (02:33)
- 视频: 2-2 Gensim构建语料词典(1) (12:48)
- 视频: 2-3 Gensim构建语料词典(2) (05:48)
- 视频: 2-4 Gensim统计词频特征 (05:49)
- 视频: 2-5 Gensim计算TT-IDF(1) (11:12)
- 视频: 2-6 Gensim计算TF-IDF(2) (04:24)
- 视频: 2-7 LSA潜在语义分析-加载数据(1) (06:21)
- 视频: 2-8 LSA潜在语义分析-生成主题模型(2) (10:09)
- 视频: 2-9 LDA隐含狄利克雷分布(1) (10:36)
- 视频: 2-10 LDA隐含狄利克雷分布(2) (02:18)
- 视频: 2-11 RP生成随机映射 (05:10)
- 视频: 2-12 HDP分层狄利克雷过程 (05:16)
- 视频: 2-13 Gensim实现新闻文本特征向量化(1) (08:24)
- 视频: 2-14 Gensim实现新闻文本特征向量化(2) (07:42)
- 视频: 2-15 Gensim实现新闻文本特征向量化(3) (11:11)
- 视频: 2-16 Gensim实现新闻文本特征向量化(4) (02:02)